
\chapter{Copulas}
\section{Copulas的由来}	
\textbf{主要在于符号的熟悉。}

多个变量间的依赖关系，如果要度量，最好就是用联合密度函数函数。假设一个累积分布函数可以写成，
\[ F_{1,2,\cdots,n}(y_1,y_2,\cdots,y_n)\equiv P(Y_1<y_1,Y_2<y_2,\cdots,Y_n<y_n) \]

大写的$ Y $是随机变量，小写的$ y $是实数。那么很显然，通过对上式的积分可以得到单个变量的边缘累积密度。或者写成，
\[ F_i(y_i)= F_{1,2,\cdots,n}(\infty,\cdots,y_i,\infty),\hspace{2em}i=1,2,\cdots,n\]

如果我们将随机变量$ Y_{i} $的第$ t $个观测值插入到上式，算它的单变量边缘累积概率，可以得到，
\[ U_{it}=F_{i}(Y_{it}),\hspace{4em}\forall i,t\]

要注意，只要原始变量是连续的，随机变量$ U_{it} $就是均匀分布的。\textbf{但是它们不是独立的}。那么这些$ U $构成的联合分布就叫copula，数学上可以写成，
\begin{equation}\label{copula}
 C(u_1,u_2,\cdots,u_n)= F_{1,2,\cdots,n}(F_1^{-1}(u_1),\cdots,F_n^{-1}(u_n))
\end{equation}

其中，
\[ u_1=F_1(y_1)\Longrightarrow y_1=F_1^{-1}(u_1) \]

所以\eqref{copula}式不过是对$ F_{1,2,\cdots,n}(y_1,y_2,\cdots,y_n) $的一个改写以及变量替换后的一个新的定义。我们也可以替换回来，如
\begin{equation}\label{copula2}
F_{1,2,\cdots,n}(y_1,y_2,\cdots,y_n)=C(F_1(y_1),\cdots,F_n(y_n))
\end{equation}

\section{Copulas的两个广泛使用的函数形式}
一个是独立的copula，即
\begin{equation}\label{copind}
C_{independent}(u_1,\cdots,u_n)=\prod_{i=1}^{n}u_i
\end{equation}

这个copula就没有什么参数在里面。还有一个高斯copula，它有一个参数就是相关矩阵。令$ \Phi^R $表示相关矩阵为$ R $的多元正态累积分布函数，其均值为0，方差为1。$ \Phi $是单变量累积标准正态分布，那么高斯copula就可以写成，
\[ C_G^R(u_1,\cdots,u_n)=\Phi^R(\Phi^{-1}(u_1),\cdots,\Phi^{-1}(u_n)) \]

如果所有分布函数连续可微，那么可以有一个简单的密度函数表达(\textbf{注意是密度函数，不是累积密度函数})，
\[ f_{1,2,\cdots,n}(y_1,\cdots,y_n)=\frac{\partial F_{1,2,\cdots,n}(y_1,\cdots,y_n)}{\partial y_1\partial y_2\cdots\partial y_n} \]

可以对\eqref{copula2}式进行同样的微分，有，
\begin{equation}\label{copulaP}
 f_{1,2,\cdots,n}(y_1,\cdots,y_n)=c(u_1,\cdots,u_n)f_1(y_1)f_2(y_2)\cdots f_n(y_n)
\end{equation}


现在注意，联合密度函数看来就是边缘密度函数与copula的乘积。如果这些$ y $独立，那么copula就是1(这可以从对\eqref{copind}式微分看出来)。再注意，这个公式\eqref{copulaP}式是很一般的，比如协方差公式，他不就是两个标准差和相关系数的乘积吗？

可见\eqref{copulaP}式提供了对变量间相关性捕捉的一种非常灵活的方式。

